查看原文
其他

当把交互项加入后, 主项的系数符号竟变相反了, 这是咋回事? 如何处理呢?

计量经济圈 计量经济圈 2023-10-21

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

有意思的实证计量讨论帖, 熬夜肝完了一直的计量困惑!QA: 平方项的IV, 加时间固定符号相反, 滚动窗口回归, 面板分位数输出图, 机制分析中IV, pre5显著咋办,③主回归不显著, 分组回归却异常显著的研究来了!城市*年份联合的FE与他们分开的FE有什么区别? FE如何从一维进化到二维, 三维的?DID可以有2个处理组和1个对照组么? 有相关的参考文献吗?

社群群友问一个问题:“当把交互项加入到回归方程中后,主项变符号了,但此时的交互项显著,可不可以不管主项符号而只看交互项呢?”
举一个例子,如下:

我正在进行一个有序 logistic 回归分析。

因变量:政策评分(0-3)。

自变量:全部连续变量(GDP、腐败感知、矿山总数)。

所有自变量与因变量呈正相关。

当进行没有交互项的回归时,所有协变量都是正的。

当添加一个交互项时,GDP*腐败感知是正的,但它们各自的主效应变成了负的...

有人可以解释为什么会发生这种情况吗?

另外,没有多重共线性(VIF < 1)。

关于为什么如此,一些回答如下。

第一位群友回答:
这是由于在添加交互项时,主效应(在的情况下是GDP和腐败感知)的系数解释发生了变化。
让我们暂时搁置你的因变量(DV)的性质。当没有交互项时,GDP变量的系数告诉我们,在保持其他协变量恒定的情况下,无论其他协变量的值如何,GDP的一个单位增加会导致DV的平均变化。(腐败变量也是如此。)如果你熟悉微积分的话,可以将其表述为(关于GDP的)边际效应只是GDP系数的值。
但是当你添加交互项时,GDP的一个单位增加将不会导致DV的平均变化等于GDP系数的值。现在,GDP对DV的边际效应取决于腐败变量的水平。更准确地说,GDP对DV的边际效应将等于GDP系数的值加上交互项系数的值乘以腐败变量的值。因此,当腐败变量的值为0时,它将不影响GDP对DV的边际效应,这也是带有交互项的模型中GDP系数告诉你的:在腐败感知水平为0时,GDP对DV的边际效应是什么。在你这种情况下,这个边际效应是负的。
如果还没有这样做,你可能会想在创建交互项之前对主效应变量进行去中心化处理,因为这可能会使你的结果更有意义,更容易解释。去中心化处理意味着从各个变量个体值中减去均值。如果你这样处理,那么GDP的系数将呈现出“在腐败感知的平均水平下”对DV的边际效应。对于腐败感知的边际效应也是如此。此外,回归中截距/常数项的解释将是在GDP和腐败感知的平均水平下DV的期望值。

第二位群友回答:
首先,正如前面所指出的,这种符号变化是由于多元回归的特性所致。多元回归中的系数给出了该变量在保持模型中所有其他项恒定的情况下的边际效应。
让我们来看交互作用效应,但以一个高度简化的2x2设计为例。当然,这个原则可以扩展到连续变量,只是这样考虑会更容易一些。想象一下你的数据集看起来像这样,单元格中是均值,周围是边际均值。

正如你所看到的,无论是GDP还是腐败,都具有正的主效应,因为在“高”组中,均值都更高。模型将是:
y = b0 + b1GDP + b2Corruption(IV都是0或1)。
估计系数将导致b1和b2都是正的,因为当两者都是1时,均值很高。模型别无选择,只能以最符合数据的方式来估算系数,在这个模型中,它将会估算出两个正系数。

让我们加入交互项(GDP*Corruption),实际上,在除第一个方程之外的所有方程中,它都将为0。
现在模型有机会解释两个自变量一起为“高”时的“对角线”效应。可以通过b3解释20的高均值。模型可以估算保持交互效应恒定时的边际效应,并显示由系数b1和b2反映的剩余(边际)效应实际上是负的。
不得不补充一点:解释这样的情况可能会很快变得棘手(想象一下三个交互项情况)。如果你有一个显著的交互项,请非常小心地解释它以及任何剩余的主效应。

社群群友围绕这一问题展开了讨论,看下来还是挺让人受益匪浅。

社群群友说的JHE文章的设定如下:

不过也有群友认为,未引入交互项时若主效应为正或负,一旦引入后主效应变反了,反而可以讲出一个好故事来


延续上面的提问,那如果加入交互项后主效应变得不显著了,行不行呢?就这个问题,下方的解答和材料已被广泛认同。


看了社群群友的学术讨论后,还可以看看相关资料。
下面这个短文认为:
1.对连续自变量去中心化处理后再与其他变量做交互更易于解释,
2.交互项显著,但主项不显著没什么问题,所以对这一现象学者大可放心,
3.教你画交互项的交互图(margins, marginsplot)。

若对中间的解释不感兴趣,可以直接看上面三小段结论。
关于交互项,参看:1.交互项! 交互项! 固定效应回归模型中的交互项!2.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,3.异质性分析用来检验中间传导机制, 分组回归或交互项就可以完成机制分析,4.交互项有什么用?为啥要做异质性分析? 5.不强调内生性, 用极简截面数据和交互项, 就将经济学故事讲到领域Top刊! 6.计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论,7.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验等,8.空间计量和交互项如何使用, 将空间计量进行到底,9.交互项模型的发现, 多大程度上可信呢? 10.交互项与分组回归的区别是什么? 异质性分析,11.面板数据中去中心化的交互项回归什么情况,12.内生变量的交互项如何寻工具变量, 交互项共线咋办,13.计量经济学中"交互项"相关的5个问题和回应,14.计量回归中的交互项到底什么鬼? 捎一本书给你

关于机制分析, 调节效应分析的文章:1.计量回归中的交互项到底什么鬼? 捎一本书给你,2.计量经济学中"交互项"相关的5个问题和回应,3.实证机制分析那些事,机制分析什么鬼?,4.政策评估中"中介效应"因果分析, 增添了文献和Notes,5.内生变量的交互项如何寻工具变量, 交互项共线咋办,6.因果中介效应分析出现在顶刊, 是时候使用新方法了,7.省份/行业固定效应与年份固定效应的交乘项固定效应,8.面板数据中去中心化的交互项回归什么情况,9.面板交互固定效应是什么, 白聚山教授推动了最前沿的研究,10.跨数据比较回归系数技巧,11.U型, 倒U型, 还是线性关系, 你平常的做法不靠谱,12.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验,13.机制分析做到极致的JPE趣文, 身高与收入,14.机制分析, 中介渠道, 调节效应必读系列合集,15.自变量和中介变量是内生的情况咋办?放在因果中介的框架,16.调节变量, 中介变量和控制变量啥区别与联系? 20.中介变量需要放到回归中去吗?何时放何时不放?,21.中介效应检验流程, 示意图公布, 不再畏惧中介分析,22.控制、调节和中介变量,系说,23.学习机制分析应该阅读的经典材料有哪些?24.Top5最新: 为什么富有的父母有富有的孩子? 一篇学好机制分析的佳作!25.一文彻底弄懂调节(交互)效应, 中介(机制)效应, 控制(混淆)变量等内容,26.实证中如何做竞争性假说的检验?AER范本的方法还能当机制分析用, 27.这种机制分析方法受到经济学认可, 曾出现在经济学TOP5期刊上!



下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

4年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据

计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID

数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |

干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验

计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存